到了第十天,從前面幾篇透過範例可以快速跑 Machine Learning model 之後。我們來複習一下 Databricks 到底是什麼?
從 Getting Started 來看,Databricks 是一個基於 Apache Spark 的資料分析平台。它提供了一個簡單的使用者介面,讓使用者可以快速的進行資料分析。
官方文件說明非常的制式,我們就從左方的列表來看幾個重點:
接下來的幾篇,我們會從這幾個重點來介紹 Databricks 的功能。(希望能夠至少帶到 Data Engineering,Machine Learning,以及 workflow scheduling 的部分。)